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基于 似 物 目标 的 快速 行人 检测 算法 


刘 ft, $ 策 '， g 


d. 中 国 矿业 大 学 (北京 ) 机 电 与 信息 工程 学 院 ， 北 京 100083; 2. 宁夏 大 学 信息 工程 学 院 , 银川 750001) 


摘 要 : 针对 传统 滑动 窗口 行人 检测 速度 慢 、 无 效 窗 口 数量 大 和 识别 率 低 的 问题 ， 提 出 基于 似 物 目标 的 快速 行人 检测 
算法 。 该 算法 首先 使 用 改进 的 二 值 化 赋 范 梯度 算法 生成 目标 候选 集 ， 再 利用 提出 的 NDOG 特征 描述 子 计算 目标 特征 。 
通过 在 INRIA 和 Caltech-USA 两 个 行人 数据 库 分 析 实验 ,证 明 该 算法 可 有 效 减 少 待 检测 窗口 数量 ,提高 特征 表示 能 力 ， 
且 计算 时 间 显 著 降低 ， 使 用 线性 支持 向 量 机 作为 分 类 器 可 获得 较 高 的 行人 检测 率 。 
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Rapid pedestrian detection based on generic object generation 


Liu Qian! ?, Li Ce!, Yang Feng! 
(1. School of Mechanical Electronic & Information Engineering, China University of Mining & Technology, Beijing 10083, 
China; 2. College of Information Engineering Ningxia University, YinChuan 750001, China) 


Abstract: Detection of pedestrians on the image using a sliding window mode results in a huge amount of invalid windows and 
inefficiency. To circumvent these problems for pedestrian detection, this paper proposed an approach, based on generic object 
generation, for rapid detection of pedestrian. Firstly, the approach generated the generic object proposals by the Improved 
Binarized Normed Gradients, and then calculated the character of proposals based on our NDOG feature descriptor. 
Experimental results over the INRIA and Caltech-USA pedestrian datasets show that our approach reduces the number of 
proposals effectively, and improves the efficiency and the detection accuracy significantly along with a linear SVM classifier. 
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PS 


检测 方法 来 说 是 至 关 重 要 的 。 

在 搜索 策略 方面 ， 行 人 检测 系统 5 7 通常 先 计 算 滑动 窗口 
在 科技 水 平 飞速 发 展 ` 计 算 机 运算 能 力 不 断 提高 的 背景 下 ， (sliding window) 中 的 特征 再 判断 该 窗口 是 否 包含 行人 特征 。 
如 何 使 计算 机 更 好 的 满足 人 们 生产 生活 的 实际 需要 是 计算 机 视 ”而 在 实际 计算 过 程 中 ,一 副 图 像 对 应 的 滑动 窗口 数量 是 巨大 的 ， 
觉 领 域 的 实现 目标 。 其 中 ， 模 拟人 眼 视觉 系统 ， 通 过 对 摄像 六 且 其 绝 大 部 分 是 无 效 窗口 ， 即 不 包含 目标 对 象 或 只 包含 目标 


0 引言 


T 


拍摄 的 画面 进行 识别 和 分 析 ， 提 取 目 标 对 象 是 该 领域 工作 者 的 对 象 的 一 部 分 ， 因 此 如 何 减 少 待 检 测 窗口 的 数量 是 提高 目标 识 

研究 热点 ， 而 自然 场景 下 的 行人 识别 则 是 该 领域 的 重要 组 成 部 。 别 效 率 的 关键 。 似 物性 目标 检测 方法 ,根据 人 眼 感 知 对 象 的 原 

分 。 星 (91， 可 快速 定位 图 像 中 前 景 目标 ， 为 在 行人 识别 的 过 程 中 降 
基于 梯度 直方 图 Chistogram of oriented gradient, HOG) 低 检 测 窗口 数量 、 提 高 识别 效率 提供 了 有 效 的 解决 方法 。 

上 的 图 像 描述 方法 是 当前 人 体 模 型 建 模 的 主要 方法 之 一 。 该 算 在 似 物 目标 检测 算法 中 553， 二 值 化 赋 范 梯度 〈binarized 


法 通过 对 图 像 中 每 个 像素 点 的 梯度 幅 值 和 梯度 方向 做 统计 的 方 ” normed gradients, BING ) 检 测算 法 利用 二 级 支持 向 量 机 (support 
法 来 描述 窗口 中 像素 点 梯度 分 布 情况 。 与 其 他 常用 的 特征 表示 vector machine, SVM) 04 对 待 测 目 标的 梯度 图 像 进行 检测 。 算 


方法 相 比 ，HOG 可 较 好 的 表征 目标 对 象 的 轮廓 线条 ,提取 的 特 法 中 对 梯度 图 像 和 一 级 支持 向 量 机 模板 做 二 值 化 处 理 ， 通 过 二 
征 鲁 棒 性 强 ， 算 法 简单 易 懂 ， 代 码 量 少 。 进 制 运算 快速 实现 梯度 图 像 和 模板 的 内 积 计算 。 与 其 他 似 物 
为 提高 HOG 特征 的 表征 能 力 ， 此 后 产生 了 很 多 基于 HOG ” 标 检测 算法 相 比 ,BING 算法 仅 需要 3 毫秒 即 可 完成 目标 检索 。 
IBGE RIAS], 。 但 这 些 方法 都 无 法 实现 快速 的 行人 检测 ， 且 ”因此 ， 使 用 BING 对 图 像 中 似 物 目标 快速 检测 ， 为 降低 检测 窗 
都 忽略 了 相 邻 block 之 间 的 空间 关系 ， 而 这 个 因素 对 梯度 直方 口 数量 ， 实 现 快速 行人 检测 提供 了 可 能 。 但 BING 算法 仍 有 问 
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题 吸 待 解决 ， 


te 


如 文献 [15] 提 出 无 论 一 级 支持 向 量 机 的 模板 如 何 


HE, 对 其 算法 检测 率 的 影响 均 不 明显 。 但 作者 没有 解释 造成 
这 一 问题 的 原因 ， 也 没有 提 


出 相应 的 y 以 解决 。 


本 文通 过 对 上 述 问题 的 认真 分 析 ， 提 出 了 基于 似 物 目标 的 
快速 行人 检测 算法 。 首 先 ， PEA BING 算法 快速 识别 图 
像 中 似 物 目标 ， 然 后 结合 改进 的 HOG 方法 方向 梯度 邻 域 


描述 子 方法 


进行 行人 检测 。 


(neighborhood descriptor of oriented gradient, NDOG) 


a a ,ChinaXiy 合 作 期 于 
刘 倩 ， 等 : 基于 似 物 目标 的 快速 行人 检 5} ik 


解 单 隐 


Bl tet 


经 网 络 的 算法 ， 其 隐藏 输入 节点 权 值 随机 初始 


化 ， 


输出 权 值 根 


据 Moore-Penrose 广义 道 R1] 方 法 计算 得 出 。 该 


算法 执行 过 程 中 不 需要 调整 网 络 的 输入 权 值 以 及 隐 元 的 偏 置 ， 


速度 高 于 SVM 人 


化 推导 的 方法 得 出 与 Moore-Penrose 


且 产 生 唯一 最 优 解 ， 因 而 学 习 速度 快 且 泛 化 性 能 好 ， 其 运 和 


广义 逆 相 同 的 输出 权 值 。 


更 重要 的 是 , ELM 算法 中 输入 节点 权 值 也 可 按照 BING 算法 中 


使 用 


上 常用 的 公开 行人 数据 集 测 试 ， 并 与 


国际 ] 


原 算 法 进行 比较 。 实 验 表 


， 本 文 提 出 的 算法 显著 降低 候选 窗 


数量 ， 


节省 计算 时 间 ， 


并 达到 较 高 的 检测 率 。 


1 ”改进 的 似 物性 检测 BING 算法 


1.1 BING 算法 
在 2014 的 IEEE 国际 计算 机 视觉 与 模式 识别 会 议 (IEEE 


Conference on Computer Vision and Pattern Recognition， 简 称 


CVPR) fz! 


objectness est 


具有 较 高 检测 率 的 同时 其 运算 速度 远 远 超过 其 他 同类 算法 。 在 


明明 等 人 发 表 的 《Binarized Normed gradients for 
imation at300fps》 中 提出 了 BING 算法 。 此 算法 在 


BING 算法 


Ph， 高 效 运行 的 关键 是 利用 二 进 制 移 位 运算 和 或 运 


算 实现 测试 图 gies 


级 分 类 模板 的 内 积 运算 得 到 第 一 阶段 的 似 


物性 评估 分 值 。 
献 [15] 对 BING 算法 提 出 的 问题 所 在 。 
模板 we R” 中 权 值 ， 其 窗 


差异 。 


管 这 一 部 分 实现 了 快速 内 积 运算 ,但 也 是 文 
即 无 论 如 何 调整 其 分 类 
检测 率 与 原 算 法 的 检测 率 没 有 明显 


本 文 在 对 BING 分 析 中 发 现 ， 该 算法 在 识别 过 程 第 一 阶段 


KaR 
Liblinear09 的 squared hinge loss (或 简称 L2 loss) 支持 向 


= 


| (support vector regression, SVR) 方法 计算 得 出 。 


二 值 线性 


分 类 器 werR" ， 该 分 类 器 是 基于 


qu 
a 


BIN 


际 上 是 利 ) 


模板 W 线性 拟 合 其 他 训练 样 
第 一 阶段 的 识别 性 基 
于 Liblinear 的 L2 loss SVM 算法 对 测试 样本 进行 分 类 识别 。 图 
1 显示 第 一 阶段 分 类 器 W 对 PASCAL VOC200707 测 试 样本 的 
似 物 目标 检测 结果 。 从 图 中 可 知 ，BING 算法 的 准确 率 和 灵敏 


G 实 
A. 为 了 量化 BING 4 
本 文 使 用 同样 


能 ， 在 相同 训练 样本 集 下 ， 


度 分 别 是 73.67% 和 100%， 但 特异 度 只 有 0.0001%。 这 一 实验 
结果 说 明 所 有 测试 样本 均 被 判断 为 正 样本 。 由 此 可 以 得 出 结论 ， 
BING 算法 中 二 值 线性 分 类 器 we R" 不 具备 识别 样本 的 能 力 。 
1 
09 HS 识别 率 
LS 敏感 度 
08 Ca 特异 度 
“a 
起 
X 0.5 
Boa 
B03 
02 
0.1 
0 
BING IBING 
图 1 BING 算法 第 一 阶段 的 似 物 目标 检测 性 能 指标 


极限 学 习 机 [820 (extreme learning machine, ELM) 作为 求 


的 方法 实现 二 值 化 。 这 为 将 BING 算法 中 的 SVM 算法 替换 为 
了 可 外 


ELM 提供 
多 个 节点 组 成 > 


运算 的 结果 即 为 算法 输出 值 。 
一 组 模板 WwW ,wz ， 可 明显 提高 对 样 
了 将 BING 算法 中 第 一 阶 


EE。 从 算法 实现 原理 角度 分 析 ，ELM 隐 层 中 1 
样本 需要 与 所 有 隐 层 节点 做 内 积 运算 ， 其 共同 
若 将 BING 算法 中 模板 w 替换 为 
本 的 识别 能 力 。 图 1 显示 
段 的 SVM 算 蔡 换 为 ELM 方法 后 各 项 


分 类 评价 指标 。 


比 识别 率 提 高 了 


图 中 改进 算法 的 识别 率 是 74.43%， 较 原 算 法 相 
0.76% 。 虽 然 灵 敏 度 从 指标 上 观察 下 降 了 


24.58%, 
BING 算法 中 利 


识别 能 力 ， 大 幅 


且 特 异 度 提高 


54.35% 。 特 异 度 的 大 幅 提升 说 明 在 
用 ELM 代替 SVM 的 方法 可 以 提升 对 负 样 本 的 
减少 BING 算法 在 第 一 阶段 计算 得 到 的 候选 窗 


口 的 数量 。 


1.2 BING 的 改进 算法 


为 了 更 清楚 


地 理解 BING 算法 的 改进 方法 (improved BING， 


IBING), 本文 首先 对 BING 实现 步骤 做 简要 介绍 。 假设 有 NN 个 


训练 样本 


t; =[ti,t, i2? stal 


其 中 : 7. TAH 分 别 表 示 输 出 权 值 、 


Mao H 表示 为 


Hw,..., wr, di,..., 


w, = [wis Wis 


G(w -x, +d,) 


GW, xp +d) + 


(x,t), Hp x, 

e R”。 在 单 隐 层 前 馈 神经 网 络 中 可 表示 为 
Hn=T (1) 

HAE 


=[X1,X i2? Xin T € R" 


期 望 答 出 和 隐 层 输 


全 三 


H 


NJ 


G(w, :A +d,) | 
(2) 


G(w, :xw +d,) 


INxL 


w, 和 d; 分 别 表示 第 i G=1, ..., L) 个 隐 


节点 的 输入 权 值 和 偏差 ，G(*) 是 激活 函数 。 


在 随机 初始 
确定 隐 层 输出 矩阵 


其 中 : Hi 是 矩 


ELM 算法 中 输出 权 值 7 ， 并 利 
G 算法 中 ， 


在 IBI 


化 w 和 di 后 ， 根 据 极 小 范 数 最 小 二 乘 解 方法 


H=H'T, 
BE H 的 Moore-Penrose J if. HHUKit 7B 
JR 《1) 判断 样本 类 别 。 
将 BING 算法 中 SVM 算法 替换 为 ELM 的 


(3) 


ae 


关键 问题 


页 就 是 如 何 实现 wx 
和 做 二 值 化 处 理 


值 化 。 首先 根据 式 (4) (5) 对 w 


Nbasis 
w= > Ba; > (4) 
j=l 
Noasis 
x= Dab, (5) 
j=l 
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其 中 : Ns 是 偏差 向 量 的 个 数 ，Q0j,pBjeR 是 系数 ， 
a,b, e{-1,1}Y 是 偏差 向 量 并 且 a? ,bi e {0,1} 满足 条 件 
a =a) 0), © 
b; =b; -b . 0 


则 w 和 x 的 内 积 可 表示 为 


basis 


(Ww, X) = Sac, Lan) 
= x Y aanb) 


(8) 


其 中 : (a;,b,) =a; ,b,) —(ai,b,) (9) 
=2*<b;, 7)—2'[la +b; |]+2° 


因此 式 〈8) 可 表示 为 
(w, x) =D Ada, 


i=l j=l 
+ |b; |]-+ 2°] 可 通过 二 进 制 移 位 运 
此 ， 实 现 了 BING 算法 中 SVM HHA ELM. 


(10) 


其 中 5; =[22(by,a;) -2 
算 和 或 运算 实现 。 


2 NDOG 特征 描述 子 


HOG 首先 对 灰 度 图 像 整体 进行 边缘 检测 ， 
算 各 个 像素 点 的 梯度 幅 值 和 梯度 方向 ， 然 后 统计 各 个 cell 内 相 
同方 向 通道 的 梯度 累计 直方 图 , 最 后 由 多 个 cell 构成 一 个 block, 
block 内 所 有 cell 的 梯度 直方 图 串联 得 到 该 block 的 HOG 特征 
直方 图 。HOG 算法 允许 相 邻 block 间 的 存在 cell BBW ER 
数据 关联 性 。 按 照 Dalal 在 文献 中 提出 的 算法 ， 在 大 小 为 64 Xx 
128 的 滑动 检测 窗口 中 设 定 cell 尺寸 为 8X8 像素 点 组 成 , block 
2X2 W cell 组 成 ，block 移动 步 长 为 8 个 像素 单位 构成 的 
HOG 描述 子 对 图 像 中 行人 检测 的 漏 检 率 是 最 低 的 。 但 HOG 特 
征 长 度 为 3780 维 , 每 个 cell 平均 被 统计 4 次 , 描述 信息 里 有 四 
分 之 三 的 数据 是 重复 的 ， 宛 余 信 息 量 很 大 。 且 该 算法 没有 利 ) 
各 个 cell 之 间 的 局 部 邻 域 关系 。 

针对 上 述 问 题 ， 结 合 相 邻 样 本 具有 线性 相关 性 的 特点 P， 
提出 了 方向 梯度 邻 域 描 述 子 (NDOG) 方法 。 该 算法 不 需要 重 
# block, REA block 与 周围 相 邻 的 8 个 block 的 邻 域 关系 
通过 权 值 向 量 表 示 ， 并 将 该 向 量 串联 到 每 个 block 方向 直方 图 
向 量 的 尾部 。 

假设 样本 
N) 根据 HOG 算法 得 出 。 


利用 边缘 算 子 计 


mxn (=N)^ block 组 成 ,block bi e R” (i=1,...， 
IH bi 与 其 相 邻 的 8 个 block 之 间 的 


PUB AR W' =[W; W3.. W]; FREE tarua 吴 差 最 小 : 
a(W)=> b -Swal (11) 


其 中 权 值 W; ER b 与 第 j 个 相 邻 block 的 相似 度 , 式 (11) 


reat 


LAK AE DOW; =1 。 ERIN IR ZEIN HT 5 


à (12) 


ENX B' =[b', b,b hess N' = (BB bshes> W 


e(w') =|B'w' -NT 


=W” (Bi (13) 


=W" G'W' 


Ni y (Bi Ni wi 


其 中 G% =( 一 b)) (Bb' bn) 是 对 称 半 正 定 阵 。 HEY DONG H 


子 法 在 得 到 


LW’) =W" Giwi +AW’ 1-1) (14) 
计算 式 14) 中 Wi’ 的 一 阶 偏 导 得 
OL = 
— =2 f ' Al= 
agi GiWi+ 0 (15) 
8 
> (CD 
a A ， je, Â m=1 
Wig 5) I= a l 。 (16) 
> (GDJ gn 
8 
根据 条 件 =W; =1 计算 得 到 每 个 block 的 邻 域 点 权 值 向 量 
8 | 
G' 
ee ee A 


LTE,” 


可 能 是 奇异 矩阵 , 需要 做 正则 化 处 理 : 
G=Git+ta-l, (18) 
其 中 a 是 正则 化 参数 ，7 是 8x8 单位 矩阵 。 
从 式 (18) 可 以 看 出 相 邻 block 见 的 欧 几 里 得 距离 越 近 ， 
其 相似 度 越 高 ， 对 应 的 权 值 越 大 。 图 2 显示 了 相 邻 block 的 相 
似 度 和 权 值 的 关系 。 
HOG 算法 原理 是 利用 图 像 中 目标 和 背景 间 梯 度 幅 值 的 差 
异 以 及 梯度 方向 的 连续 性 建立 目标 特征 。 图 3 (b) 显示 了 图 3 
Ca) 中 行人 的 HOG 特征 。 从 图 3 (b) 中 可 以 看 出 行人 轮廓 处 
的 block 方向 具有 连续 性 和 一 致 性 , 但 在 HOG 算法 中 没有 量化 
block 间 的 这 一 重 
忆 此 ， 本 文 提 出 的 NDOG 算法 的 目标 之 一 就 是 量化 block 
间 的 相似 性 , 图 3 Cc) 显示 了 图 3 (b) 中 block 之 间 的 相似 性 。 
为 了 让 读者 获得 更 直观 的 感受 ， 将 权 值 小 于 均值 的 Wi 设 为 0。 
如 图 所 示 , 行人 轮廓 处 的 block 相似 性 高 于 图 像 中 的 其 他 部 分 。 
鉴于 block 5 与 其 权 值 向 量 Wi 一 一 对 应 ， 本 文 提出 将 权 值 向 量 
串联 到 对 应 block 的 尾部 ， 为 保证 对 比 标准 化 ， 需 要 对 特征 向 
量 再 使 用 二 阶梯 度 范 数 做 归 一 化 处 理 ， 串 联 后 组 成 的 向 量 即 为 
NDOG 特征 描述 子 。 


在 实际 计算 时 ，C 
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ne 


析 和 比较 具有 实际 意义 此外, ASIC BEF LIBS” RRK SVM 
过 程 的 训练 和 分 类 。 


D=1.008 D=0.126 D=0.751 4.1 候选 窗口 数量 对 比 
W=-0057  W=0.195 W=0.075 选用 INRIA 数据 库 作 为 实验 对 象 , 分 别 使 用 滑动 窗口 .BING 
算法 和 IBING 算法 计算 INRIA 每 个 测试 图 像 候选 窗口 的 数量 。 
如 图 所 示 ， 在 每 个 INRIA 的 测试 图 像 上 使 用 滑动 窗口 的 方法 因 
为 不 对 窗口 内 图 像 做 任何 识别 操作 ， 所 以 候选 窗口 数量 最 多 ， 
每 幅 测 试图 像 产生 的 滑动 窗口 数量 大 约 在 1.2 万 “2 万 个 间 。 
0 3 WI WOAS BING 算法 生成 的 候选 窗口 数量 次 之 , 但 每 个 测试 样本 的 候选 窗 
数量 仍 保持 在 1 万 个 左右 。 导 致 这 一 现象 的 原因 正 是 BING 算 
法 在 第 一 阶段 将 所 有 样本 判断 为 正 样本 的 结果 。IBING 算法 在 
包含 多 个 匹配 模板 ， 故 对 样本 的 识别 性 能 较 BING 算法 有 
明显 提升 。 在 INRIA 数据 库 的 每 个 测试 样本 中 得 到 的 候选 窗 
图 2 HOG 算法 中 block 与 相 邻 8 个 block 相似 度 和 权 值 关系 示意 图 数量 只 有 0.15 万 个 左右 ， 远 远 低 于 前 两 种 方法 得 到 的 窗口 数 
量 。 有 效 降低 了 后 续 行人 识别 的 计算 量 ， 节 省 结算 时 间 。 
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图 6 候选 窗口 数量 对 比 图 
Ca) 原始 图 像 Cb) HOG 特征 Cc) NDOG 特征 
图 3 行人 特征 描述 示意 图 Ae ATATEN ; 4 eee re ae 

NDOG 是 HOG 的 改进 算法 ,其 改进 之 处 是 在 避免 产生 特征 宛 
3 ”本 文 算 ; 余 信息 。 在 文献 [1] 中 , 若 定义 滑动 窗口 的 大 小 为 M xN 个 像素 
xA? 点 组 成 ，block FH mxm 个 像素 点 组 成 ，cell 由 nxn 个 像素 点 


本 文 是 在 基于 似 物性 目标 检测 框架 的 基础 上 实现 快速 行人 


构成 ，Block 在 滑动 窗口 中 移动 步 长 为 k 个 像素 单位 ( m 能 被 
l 


AD ee 
识别 。 首 先 使 用 本 文 提出 的 IBING 算法 得 到 似 物 目标 候选 集 ， A E, 在 一 个 cell ARERR SREY? TRE 
然后 计算 似 物性 目标 的 NDOG 特征 并 利用 SVM 进行 进一步 识 。 。 见 在 滑动 Re 
别 ， 具 体 算法 如 图 4 所 示 。 =[(M/k-1)x(N/k—-l] x(m?/n?)xi 24M =64, N=128, 
m=16,n=8, k=8, i=9 时 , HOG 描述 子 的 长 度 是 3780 维 。 

训练 阶段 测试 阶段 DOG 算法 在 计算 特征 描述 子 时 不 需要 重 车 block， 只 需要 计算 

naa coll 邻接 点 权 值 向 量 ， 并 将 向 量 〈 该 向 量 的 特征 长 度 为 8) 汪 

—- 加 到 该 cell 梯度 直方 图 向 量 的 尾部 即 可 。 因 此 ，ND0G 描述 子 


的 长 度 = (Mn) X (N/n) X (i+8) = (64/8) X (128/8) X (9+8) =2176. 
IBING 算法 训练 似 物 加 载 似 物性 目标 与 HOG 特征 相 比 ，ND0G 特征 向 量 长 度 明 显 缩短 ,不 包含 见 余 信 
息 ， 对 行人 特征 的 表示 能 力 优 于 HOG (图 3 所 示 ) 。 
4.3 行人 识别 评价 指标 对 比 
实验 对 比 了 HOG+SVM, IBING+HOG+SVM 和 本 文 提出 
的 IBING+NDOG+SVM 算法 在 INRIA 和 Caltech-USA 两 种 数 
计算 候选 目标 的 据 集 的 识别 性 能 , 评价 指标 本 文采 用 MR-FPPI (Miss Rate-False 
Positive Per Image) 曲线 趾 。 实 验 结果 如 图 7 所 示 ， 
IBING+HOG+SVM 的 误 检 数量 较 原 算法 有 明显 降低 , 但 漏 检 率 
也 略 有 升 高 。 这 是 因为 IJBING 算法 将 正 负 样 本 的 分 界面 向 正 样 
本 方向 移动 ， 造 成 了 在 提高 了 负 样 本 的 检测 能 力 的 同时 也 将 少 
量 正 样本 划分 到 负 样 本 集 内 。 但 是 ， 使 用 本 文 提 出 的 算法 识别 
图 4 本 文 提出 的 算法 流程 图 像 中 的 行人 ，MR-FPPI 性 能 要 优 于 原 算法 和 
4 ”实验 过 程 和 结果 分 析 EU 算法 。 这 是 由 于 对 候选 窗口 使 用 NDOG Hi 
述 子 提高 了 行人 特征 的 表征 能 力 ， 为 SVM 提供 更 加 有 效 的 样 
本 文中 的 实验 平台 为 Intel Core™ i5-4590 CPU @3.30 本 以 供 训练 和 识别 。 


GHz 3.30 GHz, RAM 8.00 GB, 64 bit operating system, ere x aaa a 
MATLAB R2014b。 为 验证 算法 性 能 ,本 文 使 用 INRIA‘ AI Caltech- 为 了 量化 上 述 对 比 图 的 信息 ， 表 1 显示 了 原 算法 和 改进 算 


USA 的 数据库 作 为 实验 用 样本 集 。 这 两 个 数据 库 是 行人 识别 邻 。 法 在 INRIA 数据 库 的 具体 的 平均 漏 检 率 和 识别 速度 。 其 中 平 | 
域 中 公认 的 标 ; 数据 集 ， 因此 使 它们 对 提出 算法 进行 性 能 分 漏 检 率 与 图 7 (a) 表现 一 致 ， 较 原 算法 相 比 提高 了 43%, 3 A 


生成 似 物 目标 


用 SVM 训练 
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一 = + HOG+SVM = — “HOG+SVM 
o IBING+HOG+SVM os IBING+HOG+SVM 
一 -一 -本文 算法 一 -一 -本 文 算法 
10? 10" 10° 10" 10? 10° 
(a) INRIA (b) Caltech-USA 


图 7 实验 测试 结果 对 比 医 
BE 1 算法 识别 率 和 检测 时 间 对 比 


算法 名 称 识别 率 平均 检测 时 间 ( 秒 ) 
HOG+SVM 70.35% 1.63 
IBING+HOG+SVM 70.48% 0.28 
文本 算法 75.34% 0.46 


5 ”结束 语 


在 围绕 如 何 实现 快速 行人 检测 这 一 问题 时 ， 本 文 提出 使 用 
以 物 目标 检测 算法 选取 候选 目标 再 判断 类 别 的 方法 达到 快速 识 
别 行人 的 目的 。 通 过 对 BING 算法 的 改进 ， 有 效 降低 了 候选 窗 
的 数量 ， 为 实现 后 续 快 速 行人 识别 工作 提供 了 基础 。 本 文 提 
出 的 NDOG 方法 通过 引入 令 域 权 值 信息 ， 克 服 了 HOG 算法 中 
言 息 宛 余 度 高 、 特 征 表示 不 显著 等 问题 。 实 验 结果 表明 ， 本 文 
提出 的 算法 可 大 幅 提升 行人 检测 的 实时 性 ， 并 且 识 别 性 能 有 较 
明显 的 提高 。 下 一 步 将 研究 如 何 结合 视频 时 间 信 息 ， 将 同一 行 
人 的 特征 描 坐标 轴 的 描述 信息 ， 扩 大 本 文 方法 在 
视频 检测 领域 的 应 用 范围 。 
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